Сегодня 02 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Процессоры и память

Intel Xeon 1,7 ГГц - король High-End?

⇣ Содержание

С момента первого выпуска Intel Pentium II Xeon прошло чуть меньше трех лет. Процессор базировался на том же ядре, что и Pentium II и Celeron тех дней, и позиционировался в роли процессора для high-end рабочих станций и серверов, на место Pentium Pro.

Одним из главных преимуществ Xeon было то, что процессор был достаточно мощным для большинства интенсивных серверных задач, и в то же время он сохранял функции ядра P6 для быстрого выполнения домашних/офисных приложений. Таким образом, благодаря Pentium II Xeon исчезла идея использования специализированного компьютера для работы, который не мог бы выполнять домашние/игровые приложения. Также Pentium II Xeon помог дальнейшему продвижению Intel на рынке многопроцессорных рабочих станций, который был захвачен не-x86 архитектурой.

Самый первый Pentium II Xeon был оснащен полноскоростным кэшем L2 до 2 Мб. Однако по причине использования 0,25 мкм технологии в Pentium II, кристалл был уже достаточно большим, и L2 кэш пришлось вынести за ядро и поместить на отдельном чипе, связанном внешней шиной с ядром процессора. Серия Xeon прошла долгую дорогу со своих первых дней в 1998 году. В Pentium III Xeon технология ядра уменьшилась до 0,18 мкм, поэтому кэш L2 (до 2 Мб) уже смог поместиться на кристалле процессора, что значительно улучшило производительность кэша.

Сегодня Intel продолжает свой курс по сегментированию своих флагманских процессоров и анонсирует процессор Xeon следующего поколения, который базируется на ядре Pentium 4 Willamette. Процессор называется по-старому, Intel Xeon, и выпускается в трех вариантах: 1,4 ГГц, 1,5 ГГц и 1,7 ГГц. Ядро процессора почти полностью идентично обычной (desktop) версии Pentium 4 за исключением незначительных деталей.



Архитектура Intel Xeon

Процессор Intel Xeon основан на точно таком же ядре, что и обычная версия Pentium 4. А это означает, что все то, чем гордится Pentium 4, есть и в Xeon. Но точно также это означает, что все недостатки Pentium 4 остались и в Xeon.

Мы не будем подробно останавливаться на архитектуре Pentium 4, а лишь вкратце пробежимся по основным чертам Pentium 4 и Xeon.

Гиперконвейерная технология (Hyper Pipelined Technology). У Xeon конвейер значительно длиннее, чем у Pentium III или Athlon. К сожалению, это означает, что Xeon выполняет меньше операций за такт, однако это обеспечивает путь для достижения значительно более высоких тактовых частот. В теории, работа на больших тактовых частотах позволит Xeon-у продемонстрировать весомое преимущество в производительности перед своими предшественниками, потому что факт выполнения меньших вычислений за такт не сильно заметен при умопомрачительных частотах. По этой же причине Pentium III мог достичь только 1 ГГц при использовании 0,18 мкм техпроцесса, и в то же время Xeon работает на 1,7 ГГц при том же самом техпроцессе. И как вы увидите, между ними ясно видна разница в производительности.

Улучшенное предсказание ветвлений (Improved Branch Prediction). Очевидно, что при таком длинном конвейере необходимо использовать улучшенный модуль предсказания ветвлений (BPU), как и сделано в Xeon. Можно утверждать, что BPU в Xeon является самым лучшим из всех существующих, и именно этот модуль сдерживает производительность Athlon. В любом случае, BPU в Xeon должен быть достойным, иначе недостатки гиперконвейерной архитектуры в P4 испортят всю картину.

Ядро быстрого выполнения (Rapid Execution Engine). Два ALU (арифметико-логический модуль) работают в Xeon с удвоенной скоростью (double pumped), они могут обрабатывать в два раза больше данных за такт чем обычно. Это дает ALU эффективную пропускную способность, аналогичную ALU, работающему с удвоенной тактовой частотой. В случае с 1,7 ГГц Xeon это означает, что ALU функционируют как обычные ALU (не с удвоенной скоростью) на частоте 3,4 ГГц. Такое ускорение необходимо для обеспечения у Xeon достойной производительности при работе с целыми числами. В целочисленном коде чаще всего происходят ошибки предсказания ветвлений, поэтому менее эффективное ALU привело бы к плохой производительности в целых числах, учитывая очень длинный конвейер Xeon.

Кэш с отслеживанием 12 тысяч инструкций (12K micro-op trace cache). Этот специальный кэш заменяет и улучшает традиционный кэш инструкций L1. 8-канальный ассоциативный кэш с отслеживанием выполнения кэширует операции после их декодирования и также кэширует операции по предсказанному пути выполнения. Это позволяет скрыть некоторые недостатки столь длинного конвейера.

256 кб улучшенный кэш передачи (256KB Advanced Transfer Cache). Подсистема кэша L2 в Xeon просто потрясающая, если не сказать больше. Она отличается не только 256-битной шиной от L2 кэша до процессора, но и способностью передавать данные их кэша на каждый такт, что означает превосходство по пиковой пропускной способности кэша в сравнении с другими процессорами в этом классе. У Xeon 1,7 ГГц пиковая пропускная способность при чтении/записи в кэш L2 составляет 54,4 Гбайт/с. Если сравнить с Pentium III 1,0 ГГц, то у него пропускная способность составляет 16 Гбайт/с, а у Athlon 1,33 ГГц - 10 Гбайт/с (Athlon ограничен 64-битной шиной до кэша L2).

Аппаратная упреждающая выборка (Hardware Prefetch). Xeon способен предсказывать, какие данные ему понадобятся перед реальным запросом из основной памяти, и он может заранее перевести эти данные в кэш. Таким образом, на момент запроса данных, они уже будут находиться в кэше. Если же данные так и не будут востребованы, место в кэше будет использовано вхолостую, и точно такая же ситуация произойдет и с частью пропускной способности FSB и шины памяти. В любом случае, аппаратная упреждающая выборка сводится к загрузке пропускной способности FSB/шины памяти, но благодаря следующей особенности архитектуры Xeon она так и не смогла стать серьезной проблемой.

Четырехскоростная (quad pumped) 100 МГц FSB и двухканальная RDRAM. Xeon использует 100 МГц FSB, скорость которой увеличена в четыре раза (quad pumped), таким образом она обеспечивает пропускную способность, эквивалентную 400 МГц FSB, то есть 3,2 Гбайт/с. FSB синхронно работает с двумя каналами RDRAM чипсета i850 на частоте 400 МГц используя две 16-битные шины. Таким образом, пиковая пропускная способность шины памяти составляет 3,2 Гбайт/с. Если для платформы Pentium III RDRAM была не так уж необходима, то для использования совместно с Xeon, такая память очень хорошо подходит.

SSE2. В Xeon добавлены новые 144 SSE2 инструкции к имеющимся в первом SSE 70 инструкциям. Под SPEC CPU2000 улучшение производительности с использованием одной только оптимизации под SSE2 находится в пределах 5%. Учитывая синтетическую природу теста SPEC CPU2000, очень непохоже, что SSE2 покажет нам какой-либо стоящий прирост производительности в современных приложениях. Единственное что мы не учли -SSE2 может использовать две 64-битные SIMD-Int и SIMD-FP операции. Эта возможность не используется в SPEC CPU2000 и она, возможно, еще покажет себя.


Технология Jackson - не в этот раз

Еще во время IDF существовало достаточно много причин поверить в то, что Intel Xeon будет первым процессором с использованием технологии Jackson (это ее внутреннее имя). Технология предназначена для использования одновременной многопоточности (Simultaneous Multithread, SMT) в ядре процессора. Говоря вкратце, процессор имеет аппаратное ограничение выполнения только одного потока в один момент времени. Если сравнить теоретическое число инструкций, которые процессор может выполнить за определенный такт (IPC), то оно будет намного выше действительного IPC при выполнении реальных задач. Связано это с тем, что процессор не всегда максимально загружен, и часть вычислительной мощности теряется.

Эффективность работы процессора многократно повысилась бы, если бы он был способен выполнять на аппаратном уровне несколько потоков одновременно. В этом и заключается основное преимущество технологии одновременной многопоточности.

Было бы очень логично, если бы технология Jackson начала использоваться в двухпроцессорных рабочих станциях на базе Xeon, так как приложения, которые обычно запускаются на таких станциях, должны были бы получить значительное преимущество от использования SMT ядра. К сожалению, процессор Intel Xeon, который вышел на днях, не задействует технологию Jackson.

Однако, как ясно видно по информации с IDF и по сообщениям некоторых источников, близких к Intel, технология Jackson значится в планах Intel. Эта технология должна стать большим шагом вперед для Intel, она открывает весьма любопытные возможности для увеличения производительности. Также не следует забывать, что Intel имеет обыкновение выпускать одно ядро и адаптировать его для самых важных сегментов рынка. Существует вероятность, что технология Jackson будет использоваться и в обычной версии Pentium 4, а не только в версии Xeon для рабочих станций и серверов.

Как вариант, может получиться ситуация, когда текущее ядро Willamette содержит технологию Jackson, но она не задействована ядром. Существует некоторое число проблем, которые Intel должна разрешить перед анонсом/включением поддержки Jackson, например, поддержка технологии программным обеспечением.

Мы с нетерпением ждем выхода технологии Jackson, однако, нам придется еще немного потерпеть. Не будем забывать, что к концу года планируется уменьшение технологии изготовления ядра, а в следующем году будет выпущен Xeon MP (4+ процессора) с L3 кэшем на кристалле ядра. Оба этих события могут послужить хорошей причиной для анонса технологии Jackson.

Следующая страница →
 
⇣ Содержание
Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.

window-new
Soft
Hard
Тренды 🔥
Власти Японии готовы стать поручителем по кредитам для Rapidus, строящей в Японии предприятие по выпуску 2-нм чипов 2 ч.
Проект STMicroelectronics по строительству предприятия в Италии получит 2 млрд евро субсидий 3 ч.
Привет из 2014-го: Asus выпустила обновлённую GeForce GT 710 EVO с 2 Гбайт GDDR5 12 ч.
Apple выбрала процессоры М2 Ultra и М4 для серверов, на которых будут работать ИИ-функции iPhone 15 ч.
Выставка Computex 2024 откроется 4 июня, но презентации AMD, Intel и Nvidia пройдут раньше 16 ч.
iPhone 5s официально устарел, а iPod touch 6 стал винтажным 16 ч.
Vivo оккупировала значительную часть майского рейтинга производительности AnTuTu 17 ч.
Игровой монитор Xiaomi G Pro 27i на панели Mini LED с 1152 зонами затенения выйдет на мировой рынок 17 ч.
Starlink хочет открыть для пользователей спутниковую сотовую связь уже осенью 19 ч.
Новые спутники Starlink могут уничтожить радиоастрономию на Земле, предупреждают учёные 21 ч.